Reporte Base de datos Agencia de la Educación
Fondecyt 1181239. Socialización política y educación para la ciudadanía: el rol de la familia y de la escuela.
Reporte Base de datos Agencia de la Educación
A continuación se expone el reporte técnico con el análisis de las bases de datos otorgadas por la Agencia de la Calidad de la Educación, en marco de su evaluación nacional sobre formación ciudadana realizada el año 2017 a una muestra representativa de estudiantes de 8º básico. Esta evaluación cuenta con una muestra de escuelas llegando a un total de 10.213 estudiantes de 8º básico y considera la aplicación de cuestionarios actitudinales para los/as estudiantes y sus padres.
En ese sentido, el objetivo de este reporte es profundizar en un aspecto central del proyecto Fondecyt: identificar la transmisión intergeneracionla de la desigualdad política, orientada a evaluar la coincidencia de las actitudes, conocimiento, creencias y comportamiento para el ejercicio de la ciudadanía entre padres/madres y sus hijos(as). Para esto, el presente reporte considera el análisis de tres instrumentos:
- Resultados prueba de conocimiento cívico
bbdd_puntajes - Cuestionarios a estudiantes sobre creencias, conocimiento, actitudes y prácticas (CCAP), para el ejercicio de la ciudadanía:
bbdd_estudiantes - Cuestionarios a estudiantes sobre creencias, conocimiento, actitudes y prácticas (CCAP), para el ejercicio de la ciudadanía:
bbdd_padres
Este documento se divide en cuatro secciones: análisis de calidad de las bases de datos, variables disponibles para el estudio, descripción de las principales variables relevantes para los objetivos del proyecto y análisis correlacional de las principales variables entre padres e hijos, para finalizar con una sección de análisis de regresión múltiple considerando la información disponible.
Calidad bases de datos
Información disponible
La información facilitada por la agencia de la educación se puede desglosar en tres bases de datos que tienen observación para los estudiantes de la muestra y sus padres. A continuación se detallan el número de observaciones y variables respectivas.
#Abrir bases de datos
bbdd_puntajes <- read_dta("bbdd/alumnosFc_mrun.dta")
bbdd_alumnos <- read_dta("bbdd/cuestAlumnos.dta")
bbdd_padres <- read_dta("bbdd/cuestPadres.dta")
#Transformamos nuestras bases a un data frame
bbdd_puntajes <- as.data.frame(bbdd_puntajes)
names(bbdd_puntajes) <- tolower(names(bbdd_puntajes))
bbdd_alumnos <- as.data.frame(bbdd_alumnos)
names(bbdd_alumnos) <- tolower(names(bbdd_alumnos))
bbdd_padres <- as.data.frame(bbdd_padres)
names(bbdd_padres) <- tolower(names(bbdd_padres))
#Tabla con las observaciones y variables para cada base de datos
puntajes <- dim(bbdd_puntajes)
alumnos <- dim(bbdd_alumnos)
padres <- dim(bbdd_padres)
names <- c("Puntajes", "Cuestionario Alumnos", "Cuestionario Padres")
data <- rbind(puntajes, alumnos, padres)
data <- as.data.frame(cbind(names, data))
colnames(data) <- c("Base de datos", "Observaciones", "Variables")
datatable(data, rownames=FALSE, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")Se realiza un merge con las tres bases de datos anteriores consolidando todo en una base única (bbdd). A raíz de las diferencias entre las observaciones disponibles detalladas en la tabla anterior, se obtiene un número importante de casos pérdidos para la base final.
A pesar de que la unión de estas tres bases de datos arroja una base general bbdd con 10.213 observaciones, se debe considerar que hay 3.443 casos para los que no tenemos información completa disponible en alguna de las tres bases de datos anteriores. A partir A continuación se realiza una aproximación exploratoria para las variables existentes en cada una de las tres bases de datos. En la siguiente sección se realizará un análisis más detallado de estos casos pérdidos.
Exploración bases de datos
El principal inconveniente de estas bases de datos es que las categorías 99 (doble marca) y 0 (vacío) no están registrados como casos pérdidos, por ende perdemos aún más observaciones sobre todo en el cuestionario de padres. Se debe tener claro esto a la hora de realizar los análisis en pro de las hipótesis del proyecto.
BBDD Puntajes
- Base de datos con la información sobre los puntajes obtenidos en la prueba de conocimiento cívico.
#Despejamos el environment
rm(puntajes, alumnos, padres, names, data)
#Base General con los puntajes: recodificamos el sexo a un factor
bbdd_puntajes$sexo <- rec(bbdd_puntajes$sexo, rec="M=1; F=0")
bbdd_puntajes$sexo <-factor(bbdd_puntajes$sexo, levels = c(0,1), labels = c("Mujer", "Hombre"))
#Exploramos la base de datos
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(bbdd_puntajes, idalumno, mrbd, codigocurso, numerolista, sexo, ponderador, puntaje) %>% pander() #1841 missingSkim summary statistics
n obs: 10213
n variables: 9
| variable | missing | n | n_unique | top_counts | ordered |
|---|---|---|---|---|---|
| sexo | 0 | 10213 | 2 | Hom: 5298, Muj: 4915, NA: 0 | FALSE |
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| codigocurso | 0 | 10213 | 3403.13 | 2482.78 | 398 | 8951 | ▇▆▆▂▃▂▃▂ |
| idalumno | 0 | 10213 | 5107 | 2948.38 | 1 | 10213 | ▇▇▇▇▇▇▇▇ |
| mrbd | 0 | 10213 | 47974.72 | 28664.02 | 937 | 99968 | ▇▅▆▆▆▅▅▆ |
| numerolista | 0 | 10213 | 16.73 | 10.81 | 1 | 52 | ▇▆▇▅▃▂▁▁ |
| ponderador | 1730 | 10213 | 29.88 | 47.49 | 2 | 317.71 | ▇▁▁▁▁▁▁▁ |
| puntaje | 1841 | 10213 | 477.06 | 100.59 | 200.91 | 762.53 | ▁▂▆▇▇▆▂▁ |
BBDD Alumnos
- Base de datos con las respuestas del cuestionario sobre CCAP para el ejercicio de la ciudadanía en estudiantes. Las categorías de 0 (vacío) y 99 (doble marca) se recodifican como missing.
#Base General con el cuestionario para estudiantes
#Codificamos los valores 99 como missing para todas las variables con rango [1-4]
bbdd_alumnos <- bbdd_alumnos %>%
mutate_at(vars(4:222), na_if, 99) %>%
mutate_at(vars(4:222), na_if, 0)
bbdd_alumnos <- bbdd_alumnos %>%
mutate_at(vars(22), na_if, 99) %>%
mutate_at(vars(4:222), na_if, 0)
#Exploramos la base de datos
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(bbdd_alumnos) %>% pander() Skim summary statistics
n obs: 8589
n variables: 222
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| alp1 | 133 | 8589 | 3.38 | 0.88 | 1 | 4 | ▁▁▂▁▁▃▁▇ |
| alp10 | 95 | 8589 | 1.55 | 0.5 | 1 | 2 | ▆▁▁▁▁▁▁▇ |
| alp11 | 126 | 8589 | 1.11 | 0.32 | 1 | 2 | ▇▁▁▁▁▁▁▁ |
| alp12 | 99 | 8589 | 2.06 | 0.56 | 1 | 3 | ▂▁▁▇▁▁▁▂ |
| alp13 | 139 | 8589 | 1.36 | 0.48 | 1 | 2 | ▇▁▁▁▁▁▁▅ |
| alp14_1 | 140 | 8589 | 3.01 | 0.87 | 1 | 4 | ▁▁▃▁▁▇▁▆ |
| alp14_2 | 141 | 8589 | 2.88 | 0.89 | 1 | 4 | ▂▁▃▁▁▇▁▅ |
| alp14_3 | 152 | 8589 | 3.48 | 0.76 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| alp14_4 | 205 | 8589 | 2.96 | 0.91 | 1 | 4 | ▂▁▃▁▁▇▁▆ |
| alp14_5 | 279 | 8589 | 3.05 | 0.9 | 1 | 4 | ▂▁▃▁▁▇▁▇ |
| alp14_6 | 313 | 8589 | 2.66 | 0.95 | 1 | 4 | ▃▁▆▁▁▇▁▅ |
| alp14_7 | 274 | 8589 | 2.86 | 0.94 | 1 | 4 | ▂▁▅▁▁▇▁▆ |
| alp15_1 | 156 | 8589 | 3.21 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp15_2 | 186 | 8589 | 3.38 | 0.75 | 1 | 4 | ▁▁▂▁▁▆▁▇ |
| alp15_3 | 253 | 8589 | 2.6 | 0.91 | 1 | 4 | ▂▁▆▁▁▇▁▃ |
| alp15_4 | 262 | 8589 | 3.15 | 0.81 | 1 | 4 | ▁▁▃▁▁▇▁▇ |
| alp15_5 | 323 | 8589 | 2.97 | 0.89 | 1 | 4 | ▂▁▃▁▁▇▁▆ |
| alp15_6 | 288 | 8589 | 3.14 | 0.84 | 1 | 4 | ▁▁▃▁▁▇▁▇ |
| alp16 | 143 | 8589 | 2.14 | 0.81 | 1 | 4 | ▃▁▇▁▁▃▁▁ |
| alp17_1 | 158 | 8589 | 1.41 | 0.66 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp17_10 | 421 | 8589 | 1.11 | 0.39 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp17_2 | 185 | 8589 | 1.22 | 0.53 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp17_3 | 243 | 8589 | 1.51 | 0.73 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| alp17_4 | 238 | 8589 | 1.31 | 0.6 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp17_5 | 212 | 8589 | 1.14 | 0.43 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp17_6 | 339 | 8589 | 1.14 | 0.44 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp17_7 | 436 | 8589 | 1.35 | 0.67 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp17_8 | 351 | 8589 | 1.23 | 0.56 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp17_9 | 439 | 8589 | 1.1 | 0.36 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp18_1 | 175 | 8589 | 3.77 | 1.34 | 1 | 5 | ▂▂▁▃▁▂▁▇ |
| alp18_2 | 214 | 8589 | 2.26 | 1.39 | 1 | 5 | ▇▃▁▃▁▂▁▂ |
| alp18_3 | 305 | 8589 | 1.74 | 1.03 | 1 | 5 | ▇▃▁▂▁▁▁▁ |
| alp18_4 | 391 | 8589 | 2.35 | 1.42 | 1 | 5 | ▇▅▁▃▁▂▁▂ |
| alp18_5 | 224 | 8589 | 4.19 | 1.24 | 1 | 5 | ▁▁▁▁▁▂▁▇ |
| alp19_1 | 485 | 8589 | 1.12 | 0.4 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| alp19_10 | 546 | 8589 | 2.05 | 0.86 | 1 | 3 | ▇▁▁▆▁▁▁▇ |
| alp19_2 | 724 | 8589 | 1.4 | 0.63 | 1 | 3 | ▇▁▁▃▁▁▁▁ |
| alp19_3 | 595 | 8589 | 1.24 | 0.53 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp19_4 | 1137 | 8589 | 1.49 | 0.7 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| alp19_5 | 927 | 8589 | 1.56 | 0.73 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| alp19_6 | 840 | 8589 | 1.4 | 0.66 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp19_7 | 1133 | 8589 | 1.41 | 0.67 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp19_8 | 1155 | 8589 | 1.37 | 0.67 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp19_9 | 767 | 8589 | 1.31 | 0.63 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| alp2 | 156 | 8589 | 3.73 | 3.31 | 1 | 9 | ▇▁▂▁▁▁▁▃ |
| alp20_1 | 207 | 8589 | 3.06 | 0.75 | 1 | 4 | ▁▁▁▁▁▇▁▃ |
| alp20_2 | 211 | 8589 | 3.28 | 0.73 | 1 | 4 | ▁▁▁▁▁▇▁▆ |
| alp20_3 | 289 | 8589 | 3.13 | 0.74 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp20_4 | 356 | 8589 | 3.16 | 0.74 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp20_5 | 415 | 8589 | 3.09 | 0.8 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp21_1 | 275 | 8589 | 1.71 | 0.81 | 1 | 3 | ▇▁▁▅▁▁▁▃ |
| alp21_2 | 337 | 8589 | 2.47 | 0.69 | 1 | 3 | ▂▁▁▅▁▁▁▇ |
| alp21_3 | 422 | 8589 | 1.59 | 0.76 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| alp21_4 | 443 | 8589 | 1.5 | 0.74 | 1 | 3 | ▇▁▁▂▁▁▁▂ |
| alp21_5 | 552 | 8589 | 1.68 | 0.81 | 1 | 3 | ▇▁▁▃▁▁▁▃ |
| alp21_6 | 819 | 8589 | 1.67 | 0.77 | 1 | 3 | ▇▁▁▅▁▁▁▃ |
| alp21_7 | 694 | 8589 | 2.12 | 0.84 | 1 | 3 | ▆▁▁▆▁▁▁▇ |
| alp22_1 | 206 | 8589 | 2.85 | 1.03 | 1 | 4 | ▃▁▅▁▁▇▁▇ |
| alp22_2 | 234 | 8589 | 2.56 | 1.03 | 1 | 4 | ▅▁▆▁▁▇▁▅ |
| alp22_3 | 255 | 8589 | 2.27 | 1.09 | 1 | 4 | ▇▁▇▁▁▆▁▅ |
| alp22_4 | 283 | 8589 | 2.18 | 1.03 | 1 | 4 | ▇▁▇▁▁▆▁▃ |
| alp22_5 | 276 | 8589 | 2.11 | 1.05 | 1 | 4 | ▇▁▆▁▁▅▁▃ |
| alp23_1 | 237 | 8589 | 2.19 | 0.88 | 1 | 4 | ▅▁▇▁▁▅▁▂ |
| alp23_2 | 262 | 8589 | 2.28 | 0.94 | 1 | 4 | ▅▁▇▁▁▆▁▂ |
| alp23_3 | 278 | 8589 | 2.2 | 0.99 | 1 | 4 | ▇▁▇▁▁▆▁▃ |
| alp23_4 | 312 | 8589 | 2.44 | 1 | 1 | 4 | ▅▁▇▁▁▇▁▃ |
| alp23_5 | 350 | 8589 | 2.09 | 0.95 | 1 | 4 | ▇▁▇▁▁▅▁▂ |
| alp23_6 | 390 | 8589 | 2.2 | 1 | 1 | 4 | ▇▁▇▁▁▆▁▃ |
| alp23_7 | 352 | 8589 | 2.32 | 1.05 | 1 | 4 | ▇▁▇▁▁▇▁▅ |
| alp24_1 | 180 | 8589 | 2.34 | 1.01 | 1 | 4 | ▆▁▆▁▁▇▁▃ |
| alp24_2 | 220 | 8589 | 1.98 | 0.9 | 1 | 4 | ▇▁▇▁▁▅▁▁ |
| alp24_3 | 283 | 8589 | 2.18 | 1.02 | 1 | 4 | ▇▁▇▁▁▆▁▃ |
| alp24_4 | 325 | 8589 | 1.98 | 0.93 | 1 | 4 | ▇▁▇▁▁▅▁▂ |
| alp24_5 | 372 | 8589 | 1.9 | 0.89 | 1 | 4 | ▇▁▇▁▁▃▁▁ |
| alp24_6 | 529 | 8589 | 1.98 | 0.94 | 1 | 4 | ▇▁▇▁▁▅▁▂ |
| alp24_7 | 517 | 8589 | 2.35 | 1.05 | 1 | 4 | ▇▁▆▁▁▇▁▃ |
| alp24_8 | 494 | 8589 | 1.9 | 0.99 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| alp24_9 | 437 | 8589 | 1.75 | 0.94 | 1 | 4 | ▇▁▅▁▁▂▁▁ |
| alp25_1 | 178 | 8589 | 2.81 | 1.05 | 1 | 4 | ▃▁▃▁▁▇▁▆ |
| alp25_10 | 372 | 8589 | 2.91 | 1.02 | 1 | 4 | ▃▁▃▁▁▇▁▇ |
| alp25_11 | 362 | 8589 | 2.47 | 1.12 | 1 | 4 | ▇▁▆▁▁▇▁▆ |
| alp25_2 | 223 | 8589 | 2.94 | 1.04 | 1 | 4 | ▃▁▃▁▁▇▁▇ |
| alp25_3 | 296 | 8589 | 2.93 | 1.06 | 1 | 4 | ▃▁▃▁▁▇▁▇ |
| alp25_4 | 316 | 8589 | 2.06 | 0.93 | 1 | 4 | ▇▁▇▁▁▅▁▂ |
| alp25_5 | 400 | 8589 | 1.76 | 0.87 | 1 | 4 | ▇▁▆▁▁▂▁▁ |
| alp25_6 | 522 | 8589 | 1.79 | 0.88 | 1 | 4 | ▇▁▆▁▁▂▁▁ |
| alp25_7 | 453 | 8589 | 1.69 | 0.86 | 1 | 4 | ▇▁▅▁▁▂▁▁ |
| alp25_8 | 612 | 8589 | 1.88 | 0.93 | 1 | 4 | ▇▁▆▁▁▃▁▁ |
| alp25_9 | 423 | 8589 | 2.63 | 1.05 | 1 | 4 | ▅▁▅▁▁▇▁▅ |
| alp26_1 | 205 | 8589 | 1.95 | 1.03 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| alp26_2 | 253 | 8589 | 2.74 | 1.12 | 1 | 4 | ▅▁▅▁▁▆▁▇ |
| alp26_3 | 284 | 8589 | 1.74 | 0.92 | 1 | 4 | ▇▁▃▁▁▂▁▁ |
| alp26_4 | 298 | 8589 | 1.72 | 0.96 | 1 | 4 | ▇▁▃▁▁▂▁▁ |
| alp26_5 | 299 | 8589 | 2.33 | 1.07 | 1 | 4 | ▇▁▇▁▁▇▁▅ |
| alp26_6 | 362 | 8589 | 2 | 1.01 | 1 | 4 | ▇▁▆▁▁▅▁▂ |
| alp26_7 | 389 | 8589 | 2 | 1.08 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| alp26_8 | 337 | 8589 | 1.53 | 0.89 | 1 | 4 | ▇▁▂▁▁▁▁▁ |
| alp26_9 | 327 | 8589 | 1.51 | 0.89 | 1 | 4 | ▇▁▂▁▁▁▁▁ |
| alp27_1 | 241 | 8589 | 1.89 | 0.79 | 1 | 4 | ▆▁▇▁▁▂▁▁ |
| alp27_10 | 458 | 8589 | 2.35 | 0.94 | 1 | 4 | ▅▁▇▁▁▇▁▃ |
| alp27_11 | 441 | 8589 | 2.51 | 0.95 | 1 | 4 | ▃▁▇▁▁▇▁▃ |
| alp27_12 | 453 | 8589 | 2.38 | 0.96 | 1 | 4 | ▅▁▇▁▁▇▁▃ |
| alp27_13 | 370 | 8589 | 2.39 | 1 | 1 | 4 | ▅▁▇▁▁▆▁▃ |
| alp27_2 | 278 | 8589 | 2.09 | 0.9 | 1 | 4 | ▆▁▇▁▁▅▁▂ |
| alp27_3 | 311 | 8589 | 1.99 | 0.89 | 1 | 4 | ▇▁▇▁▁▃▁▁ |
| alp27_4 | 376 | 8589 | 1.8 | 0.79 | 1 | 4 | ▇▁▇▁▁▂▁▁ |
| alp27_5 | 420 | 8589 | 2.31 | 0.93 | 1 | 4 | ▅▁▇▁▁▆▁▂ |
| alp27_6 | 495 | 8589 | 2.03 | 0.89 | 1 | 4 | ▆▁▇▁▁▃▁▂ |
| alp27_7 | 433 | 8589 | 2.66 | 1.02 | 1 | 4 | ▃▁▇▁▁▇▁▆ |
| alp27_8 | 646 | 8589 | 2.86 | 1.01 | 1 | 4 | ▃▁▅▁▁▇▁▇ |
| alp27_9 | 627 | 8589 | 1.99 | 0.85 | 1 | 4 | ▆▁▇▁▁▃▁▁ |
| alp28_1 | 358 | 8589 | 2.72 | 0.93 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp28_2 | 431 | 8589 | 2.22 | 0.89 | 1 | 4 | ▆▁▇▁▁▇▁▂ |
| alp28_3 | 484 | 8589 | 3.04 | 0.94 | 1 | 4 | ▂▁▂▁▁▇▁▇ |
| alp28_4 | 514 | 8589 | 2.26 | 0.95 | 1 | 4 | ▆▁▇▁▁▇▁▂ |
| alp28_5 | 558 | 8589 | 2.74 | 0.9 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp28_6 | 557 | 8589 | 1.93 | 0.92 | 1 | 4 | ▇▁▆▁▁▅▁▁ |
| alp28_7 | 605 | 8589 | 2.12 | 0.93 | 1 | 4 | ▇▁▇▁▁▆▁▂ |
| alp29_1 | 475 | 8589 | 3.3 | 0.82 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| alp29_2 | 606 | 8589 | 3.37 | 0.75 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| alp29_3 | 771 | 8589 | 3.28 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp29_4 | 871 | 8589 | 3.32 | 0.82 | 1 | 4 | ▁▁▂▁▁▆▁▇ |
| alp29_5 | 647 | 8589 | 2.85 | 0.97 | 1 | 4 | ▂▁▆▁▁▇▁▇ |
| alp3 | 109 | 8589 | 2.22 | 1.12 | 1 | 5 | ▇▇▁▆▁▂▁▁ |
| alp30_1 | 238 | 8589 | 2.45 | 0.93 | 1 | 4 | ▃▁▆▁▁▇▁▂ |
| alp30_2 | 290 | 8589 | 2.78 | 0.91 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp30_3 | 314 | 8589 | 2.21 | 0.97 | 1 | 4 | ▇▁▇▁▁▆▁▂ |
| alp30_4 | 328 | 8589 | 2.86 | 0.93 | 1 | 4 | ▂▁▂▁▁▇▁▅ |
| alp30_5 | 390 | 8589 | 2.7 | 1 | 1 | 4 | ▃▁▅▁▁▇▁▅ |
| alp31_1 | 339 | 8589 | 1.93 | 0.26 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_2 | 418 | 8589 | 1.91 | 0.28 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_3 | 338 | 8589 | 1.92 | 0.28 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_4 | 367 | 8589 | 1.88 | 0.32 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_5 | 405 | 8589 | 1.94 | 0.24 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_6 | 468 | 8589 | 1.94 | 0.24 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_7 | 490 | 8589 | 1.87 | 0.33 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_8 | 547 | 8589 | 1.93 | 0.25 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp31_9 | 529 | 8589 | 1.92 | 0.28 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| alp32_1 | 317 | 8589 | 2.63 | 0.87 | 1 | 4 | ▂▁▅▁▁▇▁▂ |
| alp32_10 | 638 | 8589 | 2.99 | 1 | 1 | 4 | ▂▁▅▁▁▆▁▇ |
| alp32_11 | 664 | 8589 | 2.85 | 1 | 1 | 4 | ▃▁▆▁▁▇▁▇ |
| alp32_2 | 385 | 8589 | 2.26 | 0.83 | 1 | 4 | ▃▁▇▁▁▆▁▁ |
| alp32_3 | 452 | 8589 | 3.33 | 0.89 | 1 | 4 | ▁▁▂▁▁▅▁▇ |
| alp32_4 | 469 | 8589 | 2.38 | 0.88 | 1 | 4 | ▃▁▇▁▁▆▁▂ |
| alp32_5 | 491 | 8589 | 2.72 | 0.96 | 1 | 4 | ▃▁▆▁▁▇▁▅ |
| alp32_6 | 603 | 8589 | 2.73 | 0.96 | 1 | 4 | ▂▁▆▁▁▇▁▆ |
| alp32_7 | 579 | 8589 | 2.4 | 0.9 | 1 | 4 | ▃▁▇▁▁▆▁▂ |
| alp32_8 | 610 | 8589 | 2.77 | 1 | 1 | 4 | ▃▁▇▁▁▇▁▇ |
| alp32_9 | 594 | 8589 | 2.28 | 0.94 | 1 | 4 | ▅▁▇▁▁▆▁▂ |
| alp33_1 | 488 | 8589 | 3.27 | 0.84 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| alp33_2 | 567 | 8589 | 3.32 | 0.78 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| alp33_3 | 726 | 8589 | 3.32 | 0.8 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| alp33_4 | 880 | 8589 | 3.12 | 0.84 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| alp33_5 | 731 | 8589 | 3.33 | 0.79 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| alp34_1 | 352 | 8589 | 3.08 | 0.97 | 1 | 4 | ▂▁▂▁▁▇▁▇ |
| alp34_2 | 336 | 8589 | 3.37 | 0.84 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp34_3 | 354 | 8589 | 3.34 | 0.87 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp34_4 | 450 | 8589 | 3.31 | 0.88 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp35_1 | 395 | 8589 | 3.13 | 0.8 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| alp35_2 | 384 | 8589 | 3.45 | 0.73 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp35_3 | 428 | 8589 | 3.32 | 0.78 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| alp35_4 | 494 | 8589 | 3.27 | 0.78 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp35_5 | 627 | 8589 | 3.42 | 0.74 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| alp35_6 | 627 | 8589 | 2.83 | 0.94 | 1 | 4 | ▂▁▅▁▁▇▁▅ |
| alp36_1 | 301 | 8589 | 2.79 | 0.91 | 1 | 4 | ▂▁▅▁▁▇▁▅ |
| alp36_10 | 546 | 8589 | 3.06 | 0.87 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| alp36_11 | 536 | 8589 | 2.89 | 0.83 | 1 | 4 | ▁▁▃▁▁▇▁▃ |
| alp36_12 | 501 | 8589 | 3.19 | 0.81 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp36_13 | 583 | 8589 | 3.24 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp36_14 | 567 | 8589 | 3.25 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp36_15 | 640 | 8589 | 3.31 | 0.78 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| alp36_16 | 662 | 8589 | 3.26 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp36_17 | 612 | 8589 | 3.1 | 0.83 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| alp36_2 | 359 | 8589 | 2.13 | 0.82 | 1 | 4 | ▃▁▇▁▁▃▁▁ |
| alp36_3 | 374 | 8589 | 3.06 | 0.85 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| alp36_4 | 370 | 8589 | 2.79 | 0.89 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp36_5 | 426 | 8589 | 2.83 | 0.87 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp36_6 | 469 | 8589 | 2.31 | 0.86 | 1 | 4 | ▃▁▇▁▁▅▁▂ |
| alp36_7 | 506 | 8589 | 2.53 | 0.94 | 1 | 4 | ▃▁▇▁▁▇▁▃ |
| alp36_8 | 474 | 8589 | 2.91 | 0.87 | 1 | 4 | ▂▁▃▁▁▇▁▅ |
| alp36_9 | 642 | 8589 | 3.01 | 0.87 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp37_1 | 426 | 8589 | 3.44 | 0.76 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp37_2 | 513 | 8589 | 3.49 | 0.71 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| alp37_3 | 538 | 8589 | 1.88 | 1.02 | 1 | 4 | ▇▁▃▁▁▃▁▂ |
| alp37_4 | 468 | 8589 | 2.17 | 1.09 | 1 | 4 | ▇▁▅▁▁▆▁▃ |
| alp37_5 | 532 | 8589 | 3.52 | 0.72 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| alp37_6 | 613 | 8589 | 1.98 | 1.03 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| alp37_7 | 572 | 8589 | 2.1 | 1.06 | 1 | 4 | ▇▁▅▁▁▅▁▂ |
| alp38_1 | 471 | 8589 | 2.78 | 0.89 | 1 | 4 | ▂▁▅▁▁▇▁▅ |
| alp38_2 | 604 | 8589 | 2.7 | 0.86 | 1 | 4 | ▂▁▆▁▁▇▁▃ |
| alp38_3 | 759 | 8589 | 2.6 | 0.87 | 1 | 4 | ▂▁▆▁▁▇▁▃ |
| alp38_4 | 804 | 8589 | 2.72 | 0.85 | 1 | 4 | ▂▁▅▁▁▇▁▃ |
| alp38_5 | 825 | 8589 | 2.93 | 0.84 | 1 | 4 | ▁▁▃▁▁▇▁▅ |
| alp39_1 | 439 | 8589 | 2.18 | 0.97 | 1 | 4 | ▇▁▇▁▁▆▁▂ |
| alp39_2 | 505 | 8589 | 2.26 | 1.01 | 1 | 4 | ▇▁▇▁▁▇▁▃ |
| alp39_3 | 538 | 8589 | 2.08 | 1.01 | 1 | 4 | ▇▁▆▁▁▅▁▂ |
| alp39_4 | 551 | 8589 | 3.17 | 0.93 | 1 | 4 | ▂▁▂▁▁▆▁▇ |
| alp4_1 | 674 | 8589 | 2.74 | 0.89 | 1 | 4 | ▂▁▇▁▁▇▁▅ |
| alp4_2 | 948 | 8589 | 2.06 | 1.08 | 1 | 4 | ▇▁▆▁▁▃▁▃ |
| alp4_3 | 413 | 8589 | 3.59 | 0.78 | 1 | 4 | ▁▁▁▁▁▂▁▇ |
| alp40_1 | 500 | 8589 | 2.8 | 0.92 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp40_2 | 688 | 8589 | 2.75 | 0.88 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| alp40_3 | 635 | 8589 | 2.78 | 0.93 | 1 | 4 | ▂▁▅▁▁▇▁▅ |
| alp40_4 | 599 | 8589 | 2.07 | 1.03 | 1 | 4 | ▇▁▆▁▁▅▁▂ |
| alp5_1 | 96 | 8589 | 3.16 | 0.74 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp5_10 | 253 | 8589 | 1.98 | 1.03 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| alp5_2 | 117 | 8589 | 2.77 | 0.74 | 1 | 4 | ▁▁▅▁▁▇▁▂ |
| alp5_3 | 162 | 8589 | 3.18 | 0.71 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp5_4 | 206 | 8589 | 3.06 | 0.74 | 1 | 4 | ▁▁▂▁▁▇▁▃ |
| alp5_5 | 333 | 8589 | 3.15 | 0.72 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp5_6 | 344 | 8589 | 3.2 | 0.8 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| alp5_7 | 363 | 8589 | 2.56 | 0.85 | 1 | 4 | ▂▁▆▁▁▇▁▂ |
| alp5_8 | 289 | 8589 | 2.77 | 0.78 | 1 | 4 | ▁▁▃▁▁▇▁▂ |
| alp5_9 | 285 | 8589 | 3.02 | 0.73 | 1 | 4 | ▁▁▂▁▁▇▁▃ |
| alp6_1 | 380 | 8589 | 3.01 | 0.84 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| alp6_2 | 369 | 8589 | 3.67 | 0.61 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| alp8 | 77 | 8589 | 1.05 | 0.22 | 1 | 2 | ▇▁▁▁▁▁▁▁ |
| alp9 | 114 | 8589 | 2 | 0.64 | 1 | 3 | ▃▁▁▇▁▁▁▃ |
| codigocurso | 0 | 8589 | 3432.98 | 2475.75 | 398 | 8951 | ▇▆▆▂▃▂▃▂ |
| idalumno | 0 | 8589 | 5154.52 | 2934.52 | 1 | 10213 | ▇▇▇▇▇▇▇▇ |
| p7 | 94 | 8589 | 1.87 | 0.34 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| serie | 0 | 8589 | 8114685.9 | 79746.82 | 8015795 | 8292287 | ▇▆▅▃▃▂▃▂ |
BBDD Padres
- Base de datos con las respuestas del cuestionario sobre CCAP para el ejercicio de la ciudadanía en estudiantes. Las categorías de 0 (vacío) y 99 (doble marca) se recodifican como missing. Se debe tener precaución con el mes y año de nacimiento del padre/madre pues presentan inconsistencia en los datos, además no hay una variable disponible que de cuenta de la edad del padre/madres.
#Base General con el cuestionario para padres
#Codificamos los valores 99 como missing para todas las variables con rango [1-4]
bbdd_padres <- bbdd_padres %>%
mutate_at(vars(4:141), na_if, 99) %>%
mutate_at(vars(4:141), na_if, 0)
#Exploramos la base de datos
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(bbdd_padres) %>% pander()Skim summary statistics
n obs: 6770
n variables: 141
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| codigocurso | 0 | 6770 | 3431.69 | 2467.27 | 398 | 8951 | ▇▆▆▂▃▁▃▂ |
| idalumno | 0 | 6770 | 5165.78 | 2911.15 | 1 | 10213 | ▆▇▇▇▇▇▇▇ |
| pap1_1 | 221 | 6770 | 46.28 | 194.53 | 1 | 999 | ▇▁▁▁▁▁▁▁ |
| pap1_2 | 211 | 6770 | 2078.06 | 3636.02 | 1 | 99999 | ▇▁▁▁▁▁▁▁ |
| pap10_1 | 639 | 6770 | 2.37 | 0.83 | 1 | 4 | ▂▁▇▁▁▃▁▂ |
| pap10_2 | 1585 | 6770 | 1.6 | 0.83 | 1 | 4 | ▇▁▃▁▁▁▁▁ |
| pap10_3 | 314 | 6770 | 3.18 | 0.95 | 1 | 4 | ▁▁▃▁▁▅▁▇ |
| pap11 | 102 | 6770 | 2.11 | 1.06 | 1 | 5 | ▇▇▁▆▁▁▁▁ |
| pap12 | 125 | 6770 | 1.45 | 0.5 | 1 | 2 | ▇▁▁▁▁▁▁▆ |
| pap13_1 | 356 | 6770 | 1.26 | 0.57 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_10 | 425 | 6770 | 1.03 | 0.21 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_2 | 422 | 6770 | 1.15 | 0.45 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_3 | 418 | 6770 | 1.08 | 0.34 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_4 | 441 | 6770 | 1.09 | 0.35 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_5 | 420 | 6770 | 1.08 | 0.33 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_6 | 414 | 6770 | 1.06 | 0.29 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_7 | 410 | 6770 | 1.21 | 0.55 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_8 | 411 | 6770 | 1.13 | 0.45 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap13_9 | 422 | 6770 | 1.02 | 0.15 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_1 | 405 | 6770 | 1.56 | 0.73 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| pap14_2 | 429 | 6770 | 1.54 | 0.74 | 1 | 3 | ▇▁▁▃▁▁▁▂ |
| pap14_3 | 564 | 6770 | 1.11 | 0.38 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_4 | 514 | 6770 | 1.16 | 0.48 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_5 | 491 | 6770 | 1.26 | 0.58 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_6 | 542 | 6770 | 1.13 | 0.42 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_7 | 516 | 6770 | 1.18 | 0.47 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap14_8 | 500 | 6770 | 1.12 | 0.41 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_1 | 367 | 6770 | 1.11 | 0.41 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_2 | 428 | 6770 | 1.08 | 0.32 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_3 | 449 | 6770 | 1.05 | 0.27 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_4 | 413 | 6770 | 1.32 | 0.61 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| pap15_5 | 439 | 6770 | 1.3 | 0.61 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| pap15_6 | 486 | 6770 | 1.16 | 0.47 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_7 | 458 | 6770 | 1.13 | 0.42 | 1 | 3 | ▇▁▁▁▁▁▁▁ |
| pap15_8 | 441 | 6770 | 1.34 | 0.65 | 1 | 3 | ▇▁▁▂▁▁▁▁ |
| pap16_1 | 208 | 6770 | 3.6 | 0.76 | 1 | 4 | ▁▁▁▁▁▂▁▇ |
| pap16_2 | 309 | 6770 | 2.96 | 1.1 | 1 | 4 | ▃▁▃▁▁▅▁▇ |
| pap16_3 | 419 | 6770 | 2.19 | 1.05 | 1 | 4 | ▇▁▇▁▁▆▁▃ |
| pap16_4 | 402 | 6770 | 2.67 | 1.22 | 1 | 4 | ▆▁▃▁▁▅▁▇ |
| pap16_5 | 318 | 6770 | 3.03 | 1.2 | 1 | 4 | ▃▁▂▁▁▂▁▇ |
| pap17 | 165 | 6770 | 2.26 | 0.96 | 1 | 4 | ▅▁▃▁▁▇▁▁ |
| pap18_1 | 291 | 6770 | 2.99 | 0.98 | 1 | 4 | ▂▁▃▁▁▇▁▇ |
| pap18_10 | 362 | 6770 | 2.93 | 0.93 | 1 | 4 | ▂▁▂▁▁▇▁▅ |
| pap18_11 | 410 | 6770 | 3.14 | 0.86 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| pap18_12 | 367 | 6770 | 3.34 | 0.76 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| pap18_13 | 341 | 6770 | 3.62 | 0.66 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| pap18_14 | 324 | 6770 | 3.53 | 0.68 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| pap18_15 | 314 | 6770 | 3.53 | 0.68 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| pap18_16 | 307 | 6770 | 3.46 | 0.68 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| pap18_17 | 366 | 6770 | 2.9 | 0.86 | 1 | 4 | ▁▁▃▁▁▇▁▅ |
| pap18_2 | 380 | 6770 | 1.52 | 0.65 | 1 | 4 | ▇▁▆▁▁▁▁▁ |
| pap18_3 | 320 | 6770 | 3.32 | 0.78 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| pap18_4 | 337 | 6770 | 2.64 | 0.95 | 1 | 4 | ▃▁▅▁▁▇▁▃ |
| pap18_5 | 343 | 6770 | 3.05 | 0.84 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| pap18_6 | 355 | 6770 | 1.65 | 0.74 | 1 | 4 | ▇▁▆▁▁▂▁▁ |
| pap18_7 | 394 | 6770 | 2.02 | 0.98 | 1 | 4 | ▇▁▅▁▁▆▁▂ |
| pap18_8 | 341 | 6770 | 2.83 | 0.93 | 1 | 4 | ▂▁▂▁▁▇▁▃ |
| pap18_9 | 374 | 6770 | 2.6 | 0.97 | 1 | 4 | ▃▁▃▁▁▇▁▃ |
| pap19_1 | 563 | 6770 | 2.86 | 0.92 | 1 | 4 | ▂▁▂▁▁▇▁▅ |
| pap19_2 | 683 | 6770 | 1.86 | 0.85 | 1 | 4 | ▇▁▇▁▁▃▁▁ |
| pap19_3 | 582 | 6770 | 3.32 | 0.81 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| pap19_4 | 713 | 6770 | 2.02 | 0.86 | 1 | 4 | ▆▁▇▁▁▅▁▁ |
| pap19_5 | 698 | 6770 | 2.75 | 0.88 | 1 | 4 | ▂▁▃▁▁▇▁▃ |
| pap19_6 | 652 | 6770 | 1.55 | 0.72 | 1 | 4 | ▇▁▅▁▁▁▁▁ |
| pap19_7 | 701 | 6770 | 1.9 | 0.94 | 1 | 4 | ▇▁▆▁▁▃▁▂ |
| pap2 | 159 | 6770 | 1.83 | 0.37 | 1 | 2 | ▂▁▁▁▁▁▁▇ |
| pap20_1 | 402 | 6770 | 3.22 | 0.7 | 1 | 4 | ▁▁▁▁▁▇▁▅ |
| pap20_2 | 403 | 6770 | 3.15 | 0.72 | 1 | 4 | ▁▁▁▁▁▇▁▅ |
| pap20_3 | 384 | 6770 | 3.48 | 0.68 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| pap20_4 | 448 | 6770 | 3.17 | 0.67 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| pap20_5 | 413 | 6770 | 3.13 | 0.7 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| pap21_1 | 374 | 6770 | 1.7 | 0.7 | 1 | 4 | ▇▁▇▁▁▂▁▁ |
| pap21_10 | 359 | 6770 | 2.65 | 0.85 | 1 | 4 | ▂▁▇▁▁▇▁▃ |
| pap21_11 | 343 | 6770 | 2.42 | 0.83 | 1 | 4 | ▂▁▇▁▁▆▁▂ |
| pap21_12 | 384 | 6770 | 2.46 | 0.81 | 1 | 4 | ▂▁▇▁▁▇▁▂ |
| pap21_13 | 382 | 6770 | 2.18 | 0.87 | 1 | 4 | ▃▁▇▁▁▃▁▂ |
| pap21_2 | 344 | 6770 | 1.76 | 0.76 | 1 | 4 | ▇▁▇▁▁▂▁▁ |
| pap21_3 | 365 | 6770 | 1.86 | 0.76 | 1 | 4 | ▆▁▇▁▁▂▁▁ |
| pap21_4 | 392 | 6770 | 1.32 | 0.55 | 1 | 4 | ▇▁▃▁▁▁▁▁ |
| pap21_5 | 375 | 6770 | 2.09 | 0.78 | 1 | 4 | ▃▁▇▁▁▃▁▁ |
| pap21_6 | 429 | 6770 | 1.84 | 0.75 | 1 | 4 | ▆▁▇▁▁▂▁▁ |
| pap21_7 | 330 | 6770 | 2.59 | 0.88 | 1 | 4 | ▂▁▇▁▁▇▁▃ |
| pap21_8 | 395 | 6770 | 2.48 | 0.93 | 1 | 4 | ▃▁▇▁▁▇▁▃ |
| pap21_9 | 409 | 6770 | 2.02 | 0.85 | 1 | 4 | ▅▁▇▁▁▃▁▁ |
| pap22_1 | 481 | 6770 | 2.88 | 0.77 | 1 | 4 | ▁▁▂▁▁▇▁▂ |
| pap22_2 | 425 | 6770 | 3.37 | 0.7 | 1 | 4 | ▁▁▁▁▁▇▁▇ |
| pap22_3 | 472 | 6770 | 3.06 | 0.84 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| pap22_4 | 733 | 6770 | 2.96 | 0.77 | 1 | 4 | ▁▁▂▁▁▇▁▃ |
| pap22_5 | 508 | 6770 | 3.09 | 0.82 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| pap22_6 | 481 | 6770 | 2.79 | 0.94 | 1 | 4 | ▂▁▅▁▁▇▁▅ |
| pap23_1 | 473 | 6770 | 3.51 | 0.64 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| pap23_2 | 509 | 6770 | 3.51 | 0.63 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| pap23_3 | 539 | 6770 | 3.58 | 0.6 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| pap23_4 | 603 | 6770 | 3.18 | 0.81 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| pap23_5 | 555 | 6770 | 3.45 | 0.65 | 1 | 4 | ▁▁▁▁▁▆▁▇ |
| pap24_1 | 419 | 6770 | 3.64 | 0.61 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| pap24_2 | 407 | 6770 | 3.66 | 0.6 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| pap24_3 | 463 | 6770 | 1.5 | 0.73 | 1 | 4 | ▇▁▅▁▁▁▁▁ |
| pap24_4 | 462 | 6770 | 1.78 | 0.96 | 1 | 4 | ▇▁▅▁▁▂▁▁ |
| pap24_5 | 432 | 6770 | 3.7 | 0.64 | 1 | 4 | ▁▁▁▁▁▂▁▇ |
| pap24_6 | 455 | 6770 | 1.56 | 0.79 | 1 | 4 | ▇▁▃▁▁▁▁▁ |
| pap24_7 | 469 | 6770 | 1.99 | 1.05 | 1 | 4 | ▇▁▅▁▁▃▁▂ |
| pap25_1 | 615 | 6770 | 2.06 | 0.9 | 1 | 4 | ▆▁▇▁▁▃▁▂ |
| pap25_2 | 660 | 6770 | 2.04 | 0.82 | 1 | 4 | ▅▁▇▁▁▃▁▁ |
| pap25_3 | 689 | 6770 | 1.96 | 0.77 | 1 | 4 | ▅▁▇▁▁▃▁▁ |
| pap25_4 | 680 | 6770 | 2.1 | 0.84 | 1 | 4 | ▅▁▇▁▁▅▁▁ |
| pap25_5 | 701 | 6770 | 3.12 | 1.05 | 1 | 4 | ▂▁▂▁▁▅▁▇ |
| pap26_1 | 1026 | 6770 | 1.76 | 0.91 | 1 | 4 | ▇▁▅▁▁▂▁▁ |
| pap26_2 | 866 | 6770 | 1.69 | 0.87 | 1 | 4 | ▇▁▅▁▁▂▁▁ |
| pap26_3 | 866 | 6770 | 1.51 | 0.75 | 1 | 4 | ▇▁▃▁▁▁▁▁ |
| pap26_4 | 931 | 6770 | 3.4 | 0.92 | 1 | 4 | ▁▁▁▁▁▃▁▇ |
| pap27_1 | 584 | 6770 | 1.96 | 0.2 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_2 | 598 | 6770 | 1.91 | 0.28 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_3 | 588 | 6770 | 1.96 | 0.19 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_4 | 632 | 6770 | 1.87 | 0.33 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_5 | 600 | 6770 | 1.97 | 0.17 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_6 | 606 | 6770 | 1.98 | 0.14 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_7 | 655 | 6770 | 1.87 | 0.33 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_8 | 611 | 6770 | 1.94 | 0.23 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap27_9 | 599 | 6770 | 1.97 | 0.17 | 1 | 2 | ▁▁▁▁▁▁▁▇ |
| pap28_1 | 620 | 6770 | 3.16 | 0.82 | 1 | 4 | ▁▁▂▁▁▇▁▆ |
| pap28_2 | 765 | 6770 | 2.15 | 0.9 | 1 | 4 | ▅▁▇▁▁▆▁▂ |
| pap28_3 | 627 | 6770 | 2.55 | 0.97 | 1 | 4 | ▃▁▇▁▁▇▁▅ |
| pap28_4 | 647 | 6770 | 1.59 | 0.73 | 1 | 4 | ▇▁▆▁▁▁▁▁ |
| pap3 | 178 | 6770 | 2.22 | 1.54 | 1 | 7 | ▇▂▃▁▁▁▁▁ |
| pap4 | 146 | 6770 | 1.96 | 1.53 | 1 | 9 | ▇▂▁▁▁▁▁▁ |
| pap5 | 172 | 6770 | 1.02 | 0.14 | 1 | 2 | ▇▁▁▁▁▁▁▁ |
| pap6 | 762 | 6770 | 1 | 0 | 1 | 1 | ▁▁▁▇▁▁▁▁ |
| pap7 | 1771 | 6770 | 1 | 0 | 1 | 1 | ▁▁▁▇▁▁▁▁ |
| pap8_1 | 6675 | 6770 | 1.53 | 0.5 | 1 | 2 | ▇▁▁▁▁▁▁▇ |
| pap8_10 | 6464 | 6770 | 1.48 | 0.5 | 1 | 2 | ▇▁▁▁▁▁▁▇ |
| pap8_2 | 6016 | 6770 | 1.39 | 0.49 | 1 | 2 | ▇▁▁▁▁▁▁▅ |
| pap8_3 | 5756 | 6770 | 1.47 | 0.5 | 1 | 2 | ▇▁▁▁▁▁▁▇ |
| pap8_4 | 5620 | 6770 | 1.42 | 0.49 | 1 | 2 | ▇▁▁▁▁▁▁▆ |
| pap8_5 | 4631 | 6770 | 1.37 | 0.48 | 1 | 2 | ▇▁▁▁▁▁▁▅ |
| pap8_6 | 6276 | 6770 | 1.41 | 0.49 | 1 | 2 | ▇▁▁▁▁▁▁▆ |
| pap8_7 | 5560 | 6770 | 1.38 | 0.49 | 1 | 2 | ▇▁▁▁▁▁▁▅ |
| pap8_8 | 6366 | 6770 | 1.44 | 0.5 | 1 | 2 | ▇▁▁▁▁▁▁▆ |
| pap8_9 | 5922 | 6770 | 1.42 | 0.49 | 1 | 2 | ▇▁▁▁▁▁▁▆ |
| pap9 | 269 | 6770 | 1.28 | 0.45 | 1 | 2 | ▇▁▁▁▁▁▁▃ |
| serie | 0 | 6770 | 8114666.37 | 79433.83 | 8015795 | 8292287 | ▇▆▅▂▃▁▃▂ |
Análisis de no respuesta
Dadas las diferencias observadas en el merge entre las tres bases de datos se procede a realizar un análisis que tiene por objetivo dimensionar la no respuesta a los cuestionarios completos y a la prueba de conocimiento. Dada la codificación presentada en el apartado anterior se debe tener claro la existencia de missing (valores 0 y 99) para variables en particular, lo cual será revisado en detalle para las variables de interés del estudio. A continuación se presenta el análisis general de la no respuesta.
Bases de datos independientes
[1] 1841
[1] 6215
[1] 6768
La no respuesta para la base
bbdd_puntajescorresponde a 1841 observaciones, para las cuales no hay información en los resultados de la prueba de conocimiento.Para la base de datos
bbdd_alumnosno se observa una falta de respuesta completa a los cuestionarios, sin embargo, todas las variables de este estudio presentan niveles de no respuesta a considerar. Dicho esto, se debe tener en cuenta que esta base de datos solo cuenta con una muestra de 8589 observaciones para los análisis.Para el cuestionario de padres
bbdd_padresse observa que una importante conjunto de casos perdidos estan en la pregunta referida al nivel educacional alcanzado por el respondente y su cónyuge/pareja (BBDD Padres). Se especula que esto se produce a raíz de la codificación de la pregunta, en que las personas indican solo una opción de nivel educacional aunque no hay información respectiva que ayude a identificar cada pregunta. Revisar con detalle esta pregunta pues es relevante su utilización.
Merge de las bases de datos
#Identificamos respuestas en ambos cuestionarios
bbdd_alumnos$resp_al <- 1
bbdd_padres$resp_pap <- 1
#Merge con la base de alumnos
bbdd_missing1 <- merge(bbdd_puntajes, bbdd_alumnos, by="idalumno", all=T, suffixes = c("",".y"))
#Identificamos missing
bbdd_missing1$resp_al[is.na(bbdd_missing1$puntaje) & bbdd_missing1$resp_al == 1] <- 0
#Exploramos
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(as.factor(bbdd_missing1$resp_al)) %>% pander()Skim summary statistics
n obs:
n variables:
| variable | missing | n | n_unique |
|---|---|---|---|
| as.factor(bbdd_missing1$resp_al) | 1624 | 10213 | 2 |
| top_counts | ordered |
|---|---|
| 1: 8344, NA: 1624, 0: 245 | FALSE |
#Dado del nivel de missing de la base original se obtiene la diferencia
(1624 + 245)-1841 #Hay 28 observaciones más con los resultados en la prueba de conocimiento.[1] 28
#Generamos una base de datos solo con la información disponible
bbdd1<- merge(bbdd_puntajes, bbdd_alumnos, by="idalumno", all=F, suffixes = c("",".y"))
bbdd1$resp_al[is.na(bbdd1$puntaje) & bbdd1$resp_al == 1] <- 0
bbdd1 <- bbdd1[!bbdd1$resp_al == "0", ]
#Realizamos el mismo ejercicio para identificar los missing con el cuestionario de padres a partir de la última base de datos generada
bbdd_missing2 <- merge(bbdd1, bbdd_padres, by="idalumno", all=T, suffixes = c("",".y"))
#Identificamos missing
bbdd_missing2$resp_pap[is.na(bbdd_missing2$resp_al) & bbdd_missing2$resp_pap == 1] <- 0
skim(as.factor(bbdd_missing2$resp_pap)) %>% pander()Skim summary statistics
n obs:
n variables:
| variable | missing | n | n_unique |
|---|---|---|---|
| as.factor(bbdd_missing2$resp_pap) | 2002 | 8772 | 2 |
| top_counts | ordered |
|---|---|
| 1: 6342, NA: 2002, 0: 428 | FALSE |
Al realizar el merge respectivo entre las bases bbdd_puntajes y bbdd_alumnos se observa la pérdida de información de 1624 observaciones para los/as cuales no tenemos datos sobre la prueba de conocimiento ni de los cuestionarios, esto se genera por defecto a la hora de unir las bases. A su vez, se observa 245 casos que aparecen con información solo en el cuestionario para estudiantes, pero no tienen un puntaje en la prueba de conocimiento, está perdida es relevante, pues considera las variables de análisis. Por último, se estima 28 observaciones adicionales que solo tienen información en la prueba de conocimiento. En definitiva, se pierden 1869 observaciones de las cuales 1841 corresponden por no tener información en la base de datos de puntaje y 28 por no tener información en los cuestionarios.
El merge de ambas bases de datos nos deja un saldo de 8344 casos en los que efectivamente hay información de datos con los puntajes obtenidos en la prueba de conocimiento y el cuestionario respectivo (se mantienen una base de datos solo con estos casos).
Mismo ejercicio para incorporar la base de datos bbdd_padres. Aquí observamos la pérdida de 2002 casos en las que no hay información disponible para el cuestionario de padres. Nuevamente, esta información perdida se da por defecto al unir ambas bases de datos. A su vez, hay otros 428 casos para los cuales si tenemos información en el cuestionario de padres, pero no para el cuestionario de alumnos ni resultados en la prueba de conocimiento. En definitiva, la unión de las tres bases nos dejan un resultado de 6342 observaciones con información disponible en los tres insumos, lo que será la base de trabajo. Por el momento solo se etiquetan las variables utilizadas en la sección de Variables Espejo: vínculo entre padres e hijos
Finalmente, en un intento por dimensionar la no respuesta se realizan regresiones binomiales sobre no responder/responder el cuestionario con variables sociodemográficas disponibles. Lamentablemente, esto se realiza con la información disponible por lo que no hay como identificar otros antecedentes cuando no hay datos para ninguna de las bases tal como se detallo previamente. Los resultados muestran que el aumento de libros en el hogar aumenta las chances de responder el cuestionario en 1.39 veces más controlando por el sexo de los estudiantes y religión. Por otra parte, ser hombre disminuye las chances de responder el cuestionario en 0.75 veces respecto de ser mujer controlando por las otras variables. Esto podría caracterizar la no respuesta, aunque no hay suficiente información disponible para realizar un ejercicio más completo.
En la siguiente sección revisaremos las variables disponibles para proceder a su análisis descriptivo. Para este ejercicio se utilizara una base de datos consolidada con información para las tres bases de datos. En ese sentido, se asume el costo de representatividad de la muestra dada la pérdida de casos.
#Intento por dimensionar la no
#Base de datos alumnos
nresp <- subset(bbdd_missing1, select = c(resp_al, sexo, alp2, alp3))
nresp <- nresp[complete.cases(nresp$resp_al),]
nresp <- glm(as.factor(resp_al)~sexo+alp2+alp3, data=nresp, family="binomial")
#Tabla
stargazer(nresp, title = "No respuesta cuestionario alumnos",
covariate.labels=c("Sexo estudiante", "Religión", "Libros en el hogar"),
column.labels=c("Modelo Alumnos"), type ='html', font.size = "small", align = TRUE, omit.stat=c("f", "ser"), column.sep.width = "-15pt")| Dependent variable: | |
| as.factor(resp_al) | |
| Modelo Alumnos | |
| Sexo estudiante | -0.289** |
| (0.137) | |
| Religión | -0.020 |
| (0.020) | |
| Libros en el hogar | 0.327*** |
| (0.069) | |
| Constant | 3.141*** |
| (0.182) | |
| Observations | 8,389 |
| Log Likelihood | -1,038.569 |
| Akaike Inf. Crit. | 2,085.139 |
| Note: | p<0.1; p<0.05; p<0.01 |
[1] 1.386801
[1] 0.7490122
Variables Disponibles
La siguiente sección tiene por objetivo presentar las variables analizadas por el estudio de la Agencia de la Calidad de la Educación. Dado de que no se dispone de los cuestionarios ni un libro de códigos directos, se procede a presentar las preguntas y variables con la información disponible. Finalmente se expone las principales variables que puedan ser relevantes para el proyecto de investigación.
Preguntas de los cuestionarios
A continuación se presentan un desgloce de todas las preguntas de los cuestionarios enfocado a identificar si se encuentra disponible en la base de datos para alumnos y padres, categorizarla según temática de estudio, descripción de la pregunta y principales atributos. Dada ciertas inconsistencias observadas en la base de datos se detallan observaciones para ciertas variables problemáticas.
#Despejamos el environment
rm(bbdd_missing1, bbdd1, bbdd_missing2, nresp, nrespap)
#Tabla con las variables del estudio
variables <- data.frame(read_dta("bbdd/variables_alumnos.dta"))
#Base de datos
variables <- variables %>% dplyr::select(identificador_ambos, bbdd_alumnos, bbdd_padres, categoria, descripcion, atributos, observacion)
colnames(variables) <- c("Identificador", "BBDD Alumnos", "DBBDD Padres", "Temática", "Descripción", "Atributos", "Observación")
variables <- variables[order(variables$Temática),]
datatable(variables, rownames=FALSE, filter="top", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")Temáticas del estudio
A continuación se presentan todas las temáticas presentes en los cuestionarios de alumnos y sus padres. Es importante mencionar que el identificador nos permite observar si es que dicha temática se encuentra disponible en ambas bases de datos o solo en una.
#BBDD con los temas de los cuestionarios
temas <- data.frame(read_dta("bbdd/temas.dta"))
colnames(temas) <- c("Identificador", "Temática", "Observación")
temas <- temas[order(temas$Temática),]
datatable(temas, rownames=FALSE, filter="top", options=list(pageLength=20, scro11X=TRUE), style="default", class="compact")Temás relevantes para el proyecto
A partir de las variables con información disponible en ambos cuestionarios: estudiantes y padres se considerarn como relevantes los siguientes temas de investigación para el proyecto: interés político, percepción sobre la democracia. participación política, participación en organizaciones, atributos de un buen ciudadano, confianza en las instituciones y percepciones sobre paz y violencia. La tabla a continuación detalla las preguntas específicas y sus atributos referidos a estos temas.
#Tabla con las temáticas relevantes para el proyecto
proyecto <- subset(variables, select = c(1,4,5,6))
#Filtramos por las temáticas de interés
proyecto <- proyecto %>%
filter(Identificador=="Alumno y Padres" & Temática=="Interés Político" | Temática=="Percepciones sobre la democracia" | Temática=="Participación Política" | Temática=="Participación en organizaciones" | Temática=="Buen Ciudadano" | Temática=="Confianza en las instituciones" | Temática=="Percepciones sobre paz y violencia" | Temática=="Clima escolar")
#Tabla
proyecto <- subset(proyecto, select = c(2:4))
datatable(proyecto, rownames=FALSE, filter="top", options=list(pageLength=20, scro11X=TRUE), style="default", class="compact")Otras temáticas interesantes de observar y que no están consideradas en este listado y análisis son las siguientes: actitudes hacia inmigrantes y grupos étnicos, actitudes hacia la equidad de género, percepciones sobre la igualdad de oportunidades y preferencias por desigualdad. En términos de variables sociodemográficas se consideran variables relevantes para los estudiantes y sus padres. Finalmente, en temas de clima escolar se observan 10 indicadores diversos. A su vez, se evidencian inconsistencias en las siguientes variables:
- Fecha de Nacimiento (mes) padres: variable presenta varios valores atípicos dentro de la muestra final (239 casos con valor 999).
- Fecha de Nacimiento (año) padres: variable presenta varios valores atípicos dentro de la muestra final (146 casos con años de nacimiento inferiores a 1900 y 125 casos con años de nacimiento superiores a los 1995).
- Edad padres: variable no disponible en la base de datos con el cuestionario para padres.
- Trabajo principal de los padres: Variable codificada con 0 y 1, no hay más información.
- Nivel educacional de los padres: Variable con dos valores que identifica si el respondente o el cónyuge tiene un nivel educativo específico. Son 10 niveles educacionales (revisar una potencial recodificación).
#Tabla con las temáticas relevantes para el proyecto
sociod <- subset(variables, select = c(1,4,5,6))
#Filtramos por las temáticas de interés
sociod <- sociod %>%
filter(Identificador=="Padres" | Identificador=="Alumno y Padres" & Temática=="Sociodemográficos") %>%
filter(Temática=="Sociodemográficos")
#Tabla
sociod <- subset(sociod, select = c(2:4))
datatable(sociod, rownames=FALSE, filter="top", options=list(pageLength=30, scro11X=TRUE), style="default", class="compact")#Despejamos el environment
rm(proyecto, sociod, temas, variables)
#Generamos una base de datos solo con la información disponible: 6342 observaciones
bbdd<- merge(bbdd_puntajes, bbdd_alumnos, by="idalumno", all=F, suffixes = c("",".y"))
bbdd$resp_al[is.na(bbdd$puntaje) & bbdd$resp_al == 1] <- 0
bbdd <- bbdd[!bbdd$resp_al == "0", ]
#Agregamos la segunda base
bbdd <- merge(bbdd, bbdd_padres, by="idalumno", all=F, suffixes = c("",".y"))
bbdd$resp_pap[is.na(bbdd$resp_al) & bbdd$resp_pap == 1] <- 0
bbdd <- bbdd[!bbdd$resp_pap == "0", ] Variables sociodemograficas de la muestra
A continuación se presenta un análisis descriptivo de la muestra de estudiantes y sus padres en función a las variables disponibles del estudio.
Estudiantes
- Género: Distribución de la muestra de estudiantes por género.
#Revisamos la variable
sexo <- subset(bbdd, select = c("sexo"))
sexo <- sexo %>%
group_by(sexo)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
sexo$prop <- round(sexo$prop, digits = 1)
total <- c("Total", 6342, 100)
sexo <- rbind(sexo, total)
#Tabla
colnames(sexo) <- c("Genero", "Observaciones", "%")
datatable(sexo, rownames=FALSE, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")- Libros en el hogar: variable categórica que identifica la cantidad de libros en el hogar según el estudiante. Veremos en la sección de Padre/Madre también hay un indicador de esta dimensión.
#Libros en el hogar (estudiantes)
bbdd$libros <- bbdd$alp3
bbdd$libros <-factor(bbdd$libros, levels = c(1,2,3,4,5), labels = c("0 a 10", "10 a 25", "26 a 100", "101 a 200", "200 o más"))
libros <- subset(bbdd, select = c("libros"))
libros <- na.omit(libros)
#Frecuencias
libros_freq <- libros %>%
group_by(libros)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
libros_freq$prop <- round(libros_freq$prop, digits = 1)
total <- c("Total", 6267, 100)
libros_freq <- rbind(libros_freq, total)
#Tabla
colnames(libros_freq) <- c("Libros en el hogar (estudiantes)", "Observaciones", "%")
datatable(libros_freq, rownames=FALSE, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")#Graficamos cantidad de libros en el hogar
ggplot(data=libros, aes(libros)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_x_discrete(labels = c("0 a 10","10 a 25","26 a 100","101 a 200","200 o más")) + scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Libros en el hogar estudiantes (n=6267)") +
labs(x = "Cantidad de libros", y = "%") Padre/Madre
- Género: Se recodifica la variable con valores 0 para hombre (
pap2==1) y 1 mujer (pap2==2). De esta manera, se asume que el respondente es el padre o madre del estudiante.
#Género Padres
bbdd$generopap[bbdd$pap2==1] <- 0 #Padre (Hombre)
bbdd$generopap[bbdd$pap2==2] <- 1 #Madre (Mujer)
#Revisamos la variable
genero <- subset(bbdd, select = c("generopap"))
genero <- na.omit(genero)
genero <- genero %>%
group_by(generopap)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
genero$prop <- round(genero$prop, digits = 1)
total <- c("Total", 6211, 100)
genero <- rbind(genero, total)
genero$generopap[genero$generopap==0] <- "Padre"
genero$generopap[genero$generopap==1] <- "Madre"
#Tabla
colnames(genero) <- c("Genero", "Observaciones", "%")
datatable(genero, rownames=FALSE, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")- Año de nacimiento del padre/madre (proxy edad): Dado que la variable edad del padre/madre no está disponible se procede a utilizar el año de nacimiento como una aproximación de esta dimensión. A partir de inconsistencias observadas en los datos, se procede a dejar como missing 146 observaciones con años de nacimiento inferiores a 1900 y 125 casos con años de nacimiento superiores a los 1995. En esta secuencia se generan tres variables: edad, edad del padre y edad de la madre. Si es que se utiliza esta variable en el análisis se recomienda excluir atípicos sobre los 75 años (50 observaciones).
#Corrección años de nacimiento
bbdd$pap1_2[bbdd$pap1_2<1900] <- NA
bbdd$pap1_2[bbdd$pap1_2>1995] <- NA
#Edad General (ambos padres)
bbdd$edad <- 2019 - bbdd$pap1_2
#Edad del Padre
bbdd$edad_pa <- ifelse(bbdd$genero==0, (2019 - bbdd$pap1_2), NA)
#Edad de la Madre
bbdd$edad_ma <- ifelse(bbdd$genero==1, (2019 - bbdd$pap1_2), NA)
#Descriptivos
edad <- subset(bbdd, select = c("edad", "generopap"))
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(edad$edad) %>% pander()Skim summary statistics
n obs:
n variables:
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| edad$edad | 519 | 6342 | 44.79 | 9.27 | 24 | 119 | ▂▇▅▁▁▁▁▁ |
#Gráficos
edad <- na.omit(edad)
ggplot(data=edad, aes(edad)) + geom_histogram(aes(y =..density..),binwidth=1, colour="black") + ggtitle("Histograma edad de la muestra") +
labs(x = "Edad", y = "Frecuencia") +
stat_function(fun = dnorm,
args = list(mean = mean(edad[,1], na.rm = TRUE),
sd = sd(edad[,1], na.rm = TRUE)),
colour = 'darkred', size = 1) #Edad Padre y Madre
edad$genero <-factor(edad$generopap, levels = c(0,1), labels = c("Padre", "Madre"))
#Gráfico
ggplot(data=edad, aes(edad)) +
geom_histogram(aes(y =..density..),binwidth=1, colour="black") +
facet_wrap(~generopap) +
ggtitle("Histograma Edad") +
labs(x = "Edad", y = "Frecuencia") +
stat_function(fun = dnorm,
args = list(mean = mean(edad[,1], na.rm = TRUE),
sd = sd(edad[,1], na.rm = TRUE)),
colour = 'darkred', size = 1) - Educación del padre/madre: esta variable se construyó a partir de la información disponible en 10 variables que identifican los niveles educacionales. En otras palabras, cada una de estas variables corresponde a un nivel educacional con código 1 si es que corresponde al nivel educacional del respondente y código 2 si corresponde al nivel educacional del cónyuge.
A partir de esta información se construye una nueva variable que identifica el nivel educativo del respondente y el cónyuge, en función al número de columna que tiene valor 1 y 2. Posterior a eso, se procede a identificar si corresponde al nivel educativo del padre o la madre cruzando con la variable género (se asume por defecto que el respondente es el padre/madre del alumno). Las categorías duplicadas, vale decir más de una columna con valor 1 o 2,fueron consideradas como casos pérdidos dentro de la muestra.
Finalmente, se asume esta variable como continua de 10 niveles producto de la falta de información disponible para imputar una etiqueta. En el SIMCE, por ejemplo, se utiliza una variable de 21 categorías, lo cual no permite realizar una imputación fundamentada de categorías educacionales.
#Base de datos de prueba
#ed <- subset(bbdd, select = c(242:251))
#Parte 1 codificación del nivel educativo del repondente (1) y su cónyuge/pareja (2).
#Nivel educacional del respondente (1)
#Identificamos el nivel educativo (columna con valor 1)
num1 <- apply(bbdd[242:251], 1, function(row) which(row == 1))
bbdd$educ1 <- sapply(num1, function(x){as.numeric(x[1])})
#Observamos que hay columnas duplicadas (valor 1 para dos columnas distintas)
num1_rep <- apply(bbdd[242:251], 1, function(row) which(row == 1))
bbdd$educ1_rep <- sapply(num1_rep, function(x){as.numeric(x[2])})
#Eliminamos estos duplicados
bbdd$educ1[bbdd$educ1_rep!=is.na(bbdd$educ1_rep)] <- NA
#Nivel educacional del cónyuge/pareja (2)
#Identificamos el nivel educativo (columna con valor 2)
num2 <- apply(bbdd[242:251], 1, function(row) which(row == 2))
bbdd$educ2 <- sapply(num2, function(x){as.numeric(x[1])})
#Observamos que hay columnas duplicadas (valor 2 para dos columnas distintas)
num2_rep <- apply(bbdd[242:251], 1, function(row) which(row == 2))
bbdd$educ2_rep <- sapply(num2_rep, function(x){as.numeric(x[2])})
#Eliminamos estos duplicados
bbdd$educ2[bbdd$educ2_rep!=is.na(bbdd$educ2_rep)] <- NA
#Removemos variables y objetos auxiliares
rm(num1, num1_rep, num2, num2_rep)
bbdd$educ1_rep <- NULL
bbdd$educ2_rep <- NULL
#En función al género del respondente generamos las variables que identifican el nivel educacional alcanzado por el padre y la madre:
#Educación del padre
bbdd$educpadre <-ifelse(bbdd$genero==0, bbdd$educ1, NA)
bbdd$educpadre <-ifelse(is.na(bbdd$educpadre), bbdd$educ2, bbdd$educpadre)
#Educación de la madre
bbdd$educmadre <-ifelse(bbdd$genero==1, bbdd$educ1, NA)
bbdd$educpadre <-ifelse(is.na(bbdd$educpadre), bbdd$educ2, bbdd$educpadre)
#Descriptivos
educ <- subset(bbdd, select = c("educpadre", "educmadre"))
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(educ) %>% pander()Skim summary statistics
n obs: 6342
n variables: 2
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| educmadre | 2946 | 6342 | 5.37 | 2.1 | 1 | 10 | ▂▃▃▇▂▅▁▃ |
| educpadre | 3316 | 6342 | 5.52 | 2.31 | 1 | 10 | ▃▅▅▇▂▅▂▆ |
#Gráficos
ggplot(data=educ, aes(educpadre)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_x_discrete(labels = c("0 a 10","10 a 25","26 a 100","101 a 200","200 o más")) + scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Histograma educación padre (n=3026)") +
labs(x = "Niveles educacionales", y = "%") +
scale_x_continuous(breaks=c(seq(1,10,1))) ggplot(data=educ, aes(educmadre)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_x_discrete(labels = c("0 a 10","10 a 25","26 a 100","101 a 200","200 o más")) + scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Histograma educación de la madre (n=3396)") +
labs(x = "Niveles educacionales", y = "%") +
scale_x_continuous(breaks=c(seq(1,10,1))) Dicho esto, se propone la siguiente asignación de categorías para los atributos de respuesta:
Valor 1: "Sin estudios"
Valor 2: "Educación Básica o Preparatoria incompleta"
Valor 3: "Educación Básica o Preparatoria completa"
Valor 4: "Educación Media o Humanidades incompleta"
Valor 5: "Educación Media o Humanidades completa"
Valor 6: "Técnico Superior incompleta"
Valor 7: "Técnico Superior completa"
Valor 8: "Universitaria incompleta"
Valor 9: "Universitaria completa"
Valor 10: "Estudios de posgrado (magíster o doctorado)"
- Libros en el hogar: variable categórica que identifica la cantidad de libros en el hogar según el informante a cargo del estudiante (padre/madre).
#Libros en el hogar (estudiantes)
bbdd$librospap <- bbdd$pap11
bbdd$librospap <-factor(bbdd$librospap, levels = c(1,2,3,4,5), labels = c("0 a 10", "10 a 25", "26 a 100", "101 a 200", "200 o más"))
librospap <- subset(bbdd, select = c("librospap"))
librospap <- na.omit(librospap)
#Frecuencias
libros_freq <- librospap %>%
group_by(librospap)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
libros_freq$prop <- round(libros_freq$prop, digits = 1)
total <- c("Total", 6267, 100)
libros_freq <- rbind(libros_freq, total)
#Tabla
colnames(libros_freq) <- c("Libros en el hogar (padres)", "Observaciones", "%")
datatable(libros_freq, rownames=FALSE, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")#Graficamos cantidad de libros en el hogar
ggplot(data=librospap, aes(librospap)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_x_discrete(labels = c("0 a 10","10 a 25","26 a 100","101 a 200","200 o más")) + scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Libros en el hogar padres (n=6267)") +
labs(x = "Cantidad de libros", y = "%") Ocupación: La pregunta que responde a esta variable es la siguiente: ¿Cuál es su trabajo principal y la de su cónyuge/pareja? Sin embargo las categorías de respuesta disponible no entregan información suficiente para realizar una medición apropiada de esta dimensión:
- Valor 0: “Vacío”
- Valor 1: “Tiene marca”
Esta codificación no nos permite inferir algo sustantivo respectoa la ocupación de los padres.
Puntaje en la prueba de conocimiento
Revisión descriptiva de los puntajes obtenidos en la prueba de conocimiento, en estos análisis preliminares se omite la opción de ponderar las estimaciones debido a la falta de información respecto a la construcción del ponderador.
#Descriptivos puntaje prueba de conocimiento
puntaje <- subset(bbdd, select = c("puntaje"))
skim_with(numeric = list(complete=NULL, p25=NULL, p50=NULL, p75=NULL),factor = list(complete=NULL), integer = list(complete=NULL), character = list(complete=NULL))
skim(puntaje) %>% pander()Skim summary statistics
n obs: 6342
n variables: 1
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| puntaje | 0 | 6342 | 480.89 | 100.17 | 200.91 | 762.53 | ▁▂▆▇▇▆▂▁ |
#Gráficos
ggplot(data=puntaje, aes(puntaje)) + geom_histogram(aes(y =..density..),binwidth=10, colour="black") + ggtitle("Histograma prueba de conocimiento") +
labs(x = "Puntaje", y = "") +
stat_function(fun = dnorm,
args = list(mean = mean(puntaje[,1], na.rm = TRUE),
sd = sd(puntaje[,1], na.rm = TRUE)),
colour = 'darkred', size = 1) Clima Escolar
Esta variable considera una dimensión con indicadores respectivos a la escuela y el trato de los profesores. A partir de esta información se construye como exploratorio para los análisis un indicador sumativo que incorpora las 9 primeras dimensiones pues refieren a aspectos positivos del clima escolar a diferencia de la última dimensión. Este indicador tiene un rango ajustado de 1 a 28 con una media de 19.09 y una desviación estándar de 4.59.
Escuela y profesores:
clima 1: La mayoría de mis profesores me tratan de manera justa clima 2: Los estudiantes se llevan bien con la mayoría de los profesores clima 3:. A la mayoría de los profesores les interesa el bienestar de los estudiantes clima 4: La mayoría de mis profesores realmente escuchan lo que tengo que decir clima 5: Si necesito ayuda extra, mis profesores me la darán clima 6: La mayoría de los profesores detendrían el bullying a los estudiantes clima 7: La mayoría de los estudiantes de mi escuela se trata con respeto clima 8: La mayoría de los estudiantes de mi escuela se lleva bien entre ellos clima 9: Mi escuela es un lugar en que los estudiantes se sienten seguros clima 10: Tengo miedo de ser víctima de bullying por parte de otros estudiantes
#Codificamos nuevas variables
bbdd$clima1 <- bbdd$alp5_1
bbdd$clima2 <- bbdd$alp5_2
bbdd$clima3 <- bbdd$alp5_3
bbdd$clima4 <- bbdd$alp5_4
bbdd$clima5 <- bbdd$alp5_5
bbdd$clima6 <- bbdd$alp5_6
bbdd$clima7 <- bbdd$alp5_7
bbdd$clima8 <- bbdd$alp5_8
bbdd$clima9 <- bbdd$alp5_9
bbdd$clima10 <- bbdd$alp5_10
Hmisc::label(bbdd$clima1) <- 'Trato justo'
Hmisc::label(bbdd$clima2) <- 'Buena relación estudiante/profesor'
Hmisc::label(bbdd$clima3) <- 'Interes por bienestar estudiante'
Hmisc::label(bbdd$clima4) <- 'Sentirse escuchado'
Hmisc::label(bbdd$clima5) <- 'Ayuda extra'
Hmisc::label(bbdd$clima6) <- 'Detener el bullying'
Hmisc::label(bbdd$clima7) <- 'Trato respetuoso entre estudiantes'
Hmisc::label(bbdd$clima8) <- 'Buena relación entre estudiantes'
Hmisc::label(bbdd$clima9) <- 'Sentirse seguro'
Hmisc::label(bbdd$clima10) <- 'Miedo bullying'
#Seleccionamos
clima <- subset(bbdd, select = c("clima1","clima2","clima3","clima4","clima5",
"clima6","clima7","clima8","clima9","clima10"))
#Descriptivos
skim(clima) %>% pander()Skim summary statistics
n obs: 6342
n variables: 10
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| clima1 | 61 | 6342 | 3.2 | 0.72 | 1 | 4 | ▁▁▁▁▁▇▁▅ |
| clima10 | 179 | 6342 | 1.99 | 1.03 | 1 | 4 | ▇▁▆▁▁▃▁▂ |
| clima2 | 74 | 6342 | 2.78 | 0.74 | 1 | 4 | ▁▁▃▁▁▇▁▂ |
| clima3 | 99 | 6342 | 3.21 | 0.69 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| clima4 | 139 | 6342 | 3.09 | 0.72 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| clima5 | 244 | 6342 | 3.17 | 0.72 | 1 | 4 | ▁▁▂▁▁▇▁▅ |
| clima6 | 253 | 6342 | 3.23 | 0.79 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| clima7 | 260 | 6342 | 2.58 | 0.84 | 1 | 4 | ▂▁▆▁▁▇▁▂ |
| clima8 | 199 | 6342 | 2.77 | 0.77 | 1 | 4 | ▁▁▃▁▁▇▁▂ |
| clima9 | 194 | 6342 | 3.04 | 0.72 | 1 | 4 | ▁▁▂▁▁▇▁▃ |
#Gráficos
plot_likert(clima,
axis.titles = "Clima escolar: escuela y profesores",
geom.colors = "PuBu", # colorbrewer2.org para temas
legend.labels = c("Muy de desacuerdo", "En descuerdo", "De acuerdo", "Muy de acuerdo"),
catcount = 4,
sort.frq = "neg.asc", # sort descending
digits = 0,
geom.size = 0.8) #Construímos el indicador de clima escolar (sumativo continuo)
bbdd$clima_esc <- bbdd$clima1 + bbdd$clima2 + bbdd$clima3 + bbdd$clima4 +
bbdd$clima5 + bbdd$clima6 + bbdd$clima7 + bbdd$clima8 + bbdd$clima9
#Ajustamos para que parta de 1
bbdd$clima_esc <- bbdd$clima_esc - 8
#Descriptivos
skim(bbdd$clima_esc) %>% pander()Skim summary statistics
n obs:
n variables:
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| bbdd$clima_esc | 712 | 6342 | 19.09 | 4.59 | 1 | 28 | ▁▁▁▂▅▇▃▂ |
#Gráficos
clima <- subset(bbdd, select = c("clima_esc"))
ggplot(data=clima, aes(clima_esc)) + geom_histogram(aes(y =..density..),binwidth=1, colour="black") + ggtitle("Histograma Clima Escolar (n=5630)") +
scale_x_continuous(breaks = c(1:28)) +
labs(x = "Puntaje", y = "") +
stat_function(fun = dnorm,
args = list(mean = mean(clima[,1], na.rm = TRUE),
sd = sd(clima[,1], na.rm = TRUE)),
colour = 'darkred', size = 1) Espacios de discusión: esta dimensión refiere especificamente a un clima escolar favorable a espacios de discusión particular, lo cual está íntimamente ligado a la hipótesis de este proyecto de investigación. A partir de esta información se construye como propuesta un indicador sumativo con un rango ajustado de 1 a 19, media de 13.56 y desviación estándar de 3.69. Estos indicadores son solo de uso instrumental.
Discusión 1: Los profesores estimulan a los estudiantes a formar sus propias opiniones Discusión 2: Los profesores estimulan a los estudiantes a expresar sus opiniones Discusión 3: Los estudiantes plantean hechos políticos de actualidad para ser discutidos en clases Discusión 4: Los estudiantes expresan sus opiniones en clases, aun cuando sean distintas a las de los demás Discusión 5: Los profesores estimulan a los estudiantes a conversar los temas con gente que opina distinto Discusión 6: Los profesores exponen los temas desde los distintos enfoques al explicarlos en clases
#Codificamos nuevas variables
bbdd$discusion1 <- bbdd$alp15_1
bbdd$discusion2 <- bbdd$alp15_2
bbdd$discusion3 <- bbdd$alp15_3
bbdd$discusion4 <- bbdd$alp15_4
bbdd$discusion5 <- bbdd$alp15_5
bbdd$discusion6 <- bbdd$alp15_6
Hmisc::label(bbdd$discusion1) <- 'Estimulo a formar opiniones propias (profesores)'
Hmisc::label(bbdd$discusion2) <- 'Estimulo a expresar opiniones (profesores)'
Hmisc::label(bbdd$discusion3) <- 'Proponer hechos políticos a discutir (estudiantes)'
Hmisc::label(bbdd$discusion4) <- 'Expresar opiniones distintas al resto (estudiantes)'
Hmisc::label(bbdd$discusion5) <- 'Estimulo a discutir con otros (profesores)'
Hmisc::label(bbdd$discusion6) <- 'Temas desde distintos enfoques (profesores)'
#Seleccionamos
discusion <- subset(bbdd, select = c("discusion1","discusion2","discusion3","discusion4",
"discusion5", "discusion6"))
#Descriptivos
skim(discusion) %>% pander()Skim summary statistics
n obs: 6342
n variables: 6
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| discusion1 | 101 | 6342 | 3.24 | 0.78 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
| discusion2 | 124 | 6342 | 3.41 | 0.74 | 1 | 4 | ▁▁▁▁▁▅▁▇ |
| discusion3 | 175 | 6342 | 2.6 | 0.9 | 1 | 4 | ▂▁▆▁▁▇▁▃ |
| discusion4 | 171 | 6342 | 3.17 | 0.8 | 1 | 4 | ▁▁▃▁▁▇▁▇ |
| discusion5 | 225 | 6342 | 2.98 | 0.88 | 1 | 4 | ▁▁▃▁▁▇▁▆ |
| discusion6 | 198 | 6342 | 3.15 | 0.83 | 1 | 4 | ▁▁▂▁▁▇▁▇ |
#Gráficos
plot_likert(discusion,
axis.titles = "Clima escolar: espacios de discusión",
geom.colors = "PuBu", # colorbrewer2.org para temas
legend.labels = c("Nunca", "Rara vez", "A veces", "Frecuentemente"),
catcount = 4,
sort.frq = "neg.asc", # sort descending
digits = 0,
geom.size = 0.8) #Construímos el indicador de clima escolar (sumativo continuo)
bbdd$discusion <- bbdd$discusion1 + bbdd$discusion2 + bbdd$discusion3 + bbdd$discusion4 + bbdd$discusion5 + bbdd$discusion6
#Ajustamos para que parta de 1
bbdd$discusion <- bbdd$discusion - 5
#Descriptivos
skim(bbdd$discusion) %>% pander()Skim summary statistics
n obs:
n variables:
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| bbdd$discusion | 462 | 6342 | 13.56 | 3.69 | 1 | 19 | ▁▁▂▃▅▇▆▇ |
#Gráficos
discusion <- subset(bbdd, select = c("discusion"))
ggplot(data=discusion, aes(discusion)) + geom_histogram(aes(y =..density..),binwidth=1, colour="black") + ggtitle("Histograma Discusión en la escuela (n=5880)") +
scale_x_continuous(breaks = c(1:19)) +
labs(x = "Frecuencia", y = "") +
stat_function(fun = dnorm,
args = list(mean = mean(discusion[,1], na.rm = TRUE),
sd = sd(discusion[,1], na.rm = TRUE)),
colour = 'darkred', size = 1) Variables Espejo: vínculo entre padres e hijos
A continuación se presenta la codificación y análisis descriptivo / correlacional exploratorio con las principales variables de estudio que se replican integramente en los cuestionarios para padres e hijos. Cabe mencionar que el análisis considera una base de datos con 6243 observaciones correspondiente a los datos disponibles, aunque es posible observar mayor cantidad de missing dada la respuesta en blanco de algunas variables.
Interés Político
¿Cuánto te interesas por temas políticas y sociales?
1. Nada
2. Poco
3. Bastante
4. Mucho
- Descriptivos:
#Generamos variables
bbdd$intpol_al <- bbdd$alp16
bbdd$intpol_pap <- bbdd$pap17
intpol <- subset(bbdd, select = c("intpol_al", "intpol_pap"))
skim(intpol) %>% pander()Skim summary statistics
n obs: 6342
n variables: 2
| variable | missing | n | mean | sd | p0 | p100 | hist |
|---|---|---|---|---|---|---|---|
| intpol_al | 93 | 6342 | 2.15 | 0.8 | 1 | 4 | ▃▁▇▁▁▃▁▁ |
| intpol_pap | 133 | 6342 | 2.26 | 0.96 | 1 | 4 | ▅▁▃▁▁▇▁▁ |
#Removemos missing
intpol <- na.omit(intpol)
intpol$intpol_al <-factor(intpol$intpol_al, levels = c(1,2,3,4), labels = c("Nada", "Poco", "Bastante", "Mucho"))
intpol$intpol_pap <-factor(intpol$intpol_pap, levels = c(1,2,3,4), labels = c("Nada", "Poco", "Bastante", "Mucho"))
#Frecuencias Estudiantes
intpol_freqal <- intpol %>%
group_by(intpol$intpol_al)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
intpol_freqal$prop <- round(intpol_freqal$prop, digits = 1)
total <- c("Total", 6119, 100)
intpol_freqal <- rbind(intpol_freqal, total)
#Tabla
colnames(intpol_freqal) <- c("Interés en política (estudiantes)", "Observaciones", "%")
datatable(intpol_freqal, rownames=F, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")#Frecuencias padres
intpol_freqpap <- intpol %>%
group_by(intpol$intpol_pap)%>%
summarize(n=n())%>%
mutate(prop=n/sum(n)*100)
intpol_freqpap$prop <- round(intpol_freqpap$prop, digits = 1)
total <- c("Total", 6119, 100)
intpol_freqpap <- rbind(intpol_freqpap, total)
#Tabla
colnames(intpol_freqpap) <- c("Interés en política (padres)", "Observaciones", "%")
datatable(intpol_freqpap, rownames=F, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")#Gráfico
alumnos <- ggplot(data=intpol, aes(intpol$intpol_al)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Interés política alumnos (n=6119)") +
labs(x = "Nivel de interés", y = "%")
padres <- ggplot(data=intpol, aes(intpol$intpol_pap)) + geom_bar(aes(y = ((..count..)/sum(..count..))), stat="count", colour="black") +
scale_y_continuous(labels = scales::percent) +
geom_text(aes(label = scales::percent(((..count..)/sum(..count..))),
y= ((..count..)/sum(..count..))), stat= "count", vjust=-.5, size=3) +
ggtitle("Interés política padres (n=6119)") +
labs(x = "Nivel de interés", y = "%")
#Revisamos los gráficos
ggarrange(alumnos, padres, ncol = 2, nrow = 1)- Correlaciones Policóricas: Se presentan correlaciones asumiendo la variable como categórica (tabla de correlaciones) y como continua (gráfico de asociación de las variables).
#Asociaciones
#Correlaciones Policóricas
intpol$intpol_al1 <- as.numeric(intpol$intpol_al)
intpol$intpol_pap1 <- as.numeric(intpol$intpol_pap)
intpol2 <- subset(intpol, select = c("intpol_al1", "intpol_pap1"))
cor <- polychoric(intpol2, na.rm=TRUE)
cor <- cor[["rho"]]
cor <- round(cor,2)
#Tabla
colnames(cor) <- c("Interés Alumnos", "Interés Padres")
rownames(cor) <- c("Interés Alumnos", "Interés Padres")
datatable(cor, rownames=T, filter="none", options=list(pageLength=10, scro11X=TRUE), style="default", class="compact")#Gráfico de asociación
ggplot(intpol2, aes(x=intpol_pap1,y=intpol_al1)) +
geom_point(position=position_jitter(w=0.1,h=0)) +
geom_smooth(method="lm", se=FALSE) +
xlab('Interés político Padres') +
ylab('Interés político Hijos') +
stat_cor(label.x = 3.49999, label.y = 3.5) - Regresión Múltiple lineal: Se presentan un modelo que asume la variable dependiente e independiente del modelo como continuas y otro modelo asumiendo dichas variables como categóricas ordinales.
#Ajustamos variable
#Variable continua
Hmisc::label(bbdd$intpol_al) <- 'Interés Político (Alumnos)'
Hmisc::label(bbdd$intpol_pap) <- 'Interés Político (Padres)'
#Variable Categórica
bbdd$intpol_alc <-factor(bbdd$intpol_al, levels = c(1,2,3,4), labels = c("Nada", "Poco", "Bastante", "Mucho"))
bbdd$intpol_papc <-factor(bbdd$intpol_pap, levels = c(1,2,3,4), labels = c("Nada", "Poco", "Bastante", "Mucho"))
#Modelo de regresión múltiple lineal
#Base de datos para estimación
bbdd1 <- subset(bbdd, select = c("intpol_al", "intpol_pap", "puntaje", "sexo", "clima_esc", "discusion", "educmadre", "educpadre", "libros"))
#bbdd2 <- subset(bbdd, select = c("intpol_al", "intpol_pap", "puntaje", "clima_esc", "discusion", "educmadre", "libros"))
#bbdd2$libros <- as.numeric(bbdd2$libros)
#bbdd2 <- na.omit(bbdd2)
#cor(bbdd2)
#1. Modelo original
m1 <- lm(intpol_al~intpol_pap, data=bbdd1)
m2 <- lm(intpol_al~intpol_pap + puntaje, data=bbdd1)
m3 <- lm(intpol_al~intpol_pap + puntaje + sexo, data=bbdd1)
m4 <- lm(intpol_al~intpol_pap + puntaje + sexo + clima_esc, data=bbdd1)
m5 <- lm(intpol_al~intpol_pap + puntaje + sexo + clima_esc + discusion, data=bbdd1)
m6 <- lm(intpol_al~intpol_pap + puntaje + sexo + clima_esc + discusion + libros, data=bbdd1)
m7 <- lm(intpol_al~intpol_pap + sexo + clima_esc + discusion + puntaje*libros, data=bbdd1)
#Tabla con las regresiones
stargazer(m1,m2,m3,m4,m5,m6,m7, title = "Modelos de regresión lineal interés político (estudiantes)",
covariate.labels=c("Interés politico (Padre)", "Hombre", "Clima Escolar", "Espacios de discusion", "Conocimiento Cívico", "Libros hogar: 10 a 25", "Libros hogar: 26 a 100", "Libros hogar: 101 a 200", "Libros hogar: 200 o más"),
column.labels=c("Modelo","Modelo","Modelo","Modelo","Modelo", "Modelo", "Modelo"), type ='html', font.size = "small", align = TRUE, omit.stat=c("f", "ser"), column.sep.width = "-15pt")| Dependent variable: | |||||||
| intpol_al | |||||||
| Modelo | Modelo | Modelo | Modelo | Modelo | Modelo | Modelo | |
| (1) | (2) | (3) | (4) | (5) | (6) | (7) | |
| Interés politico (Padre) | 0.099*** | 0.076*** | 0.076*** | 0.076*** | 0.080*** | 0.072*** | 0.071*** |
| (0.011) | (0.010) | (0.010) | (0.011) | (0.011) | (0.011) | (0.011) | |
| Hombre | 0.002*** | 0.002*** | 0.002*** | 0.002*** | 0.001*** | 0.001*** | |
| (0.0001) | (0.0001) | (0.0001) | (0.0001) | (0.0001) | (0.0002) | ||
| Clima Escolar | -0.024 | -0.029 | -0.011 | -0.013 | -0.013 | ||
| (0.020) | (0.021) | (0.021) | (0.021) | (0.021) | |||
| Espacios de discusion | 0.019*** | 0.007*** | 0.007*** | 0.007*** | |||
| (0.002) | (0.003) | (0.003) | (0.003) | ||||
| Conocimiento Cívico | 0.029*** | 0.030*** | 0.030*** | ||||
| (0.003) | (0.003) | (0.003) | |||||
| Libros hogar: 10 a 25 | 0.082*** | 0.240* | |||||
| (0.027) | (0.135) | ||||||
| Libros hogar: 26 a 100 | 0.144*** | 0.112 | |||||
| (0.029) | (0.146) | ||||||
| Libros hogar: 101 a 200 | 0.250*** | 0.140 | |||||
| (0.043) | (0.218) | ||||||
| Libros hogar: 200 o más | 0.268*** | -0.642** | |||||
| (0.052) | (0.259) | ||||||
| puntaje:libros10 a 25 | -0.0003 | ||||||
| (0.0003) | |||||||
| puntaje:libros26 a 100 | 0.0001 | ||||||
| (0.0003) | |||||||
| puntaje:libros101 a 200 | 0.0002 | ||||||
| (0.0004) | |||||||
| puntaje:libros200 o más | 0.002*** | ||||||
| (0.0005) | |||||||
| Constant | 1.930*** | 1.080*** | 1.101*** | 0.794*** | 0.622*** | 0.655*** | 0.676*** |
| (0.026) | (0.052) | (0.055) | (0.068) | (0.072) | (0.073) | (0.108) | |
| Observations | 6,119 | 6,119 | 6,119 | 5,475 | 5,244 | 5,208 | 5,208 |
| R2 | 0.014 | 0.068 | 0.068 | 0.081 | 0.094 | 0.104 | 0.107 |
| Adjusted R2 | 0.014 | 0.068 | 0.068 | 0.080 | 0.093 | 0.102 | 0.104 |
| Note: | p<0.1; p<0.05; p<0.01 | ||||||
#Gráfico de interacciones
plot_model(m7, type = "int", title = "Interacción conocimiento cívico y libros en el hogar",
axis.title = c("Puntaje", "Interés Político (alumnos)"), legend.title = "Libros en el hogar")- Regresión Múltiple logística ordinal:
#Base de datos con nuestras variables
bbdd1 <- subset(bbdd, select = c("intpol_alc", "intpol_papc", "puntaje", "sexo", "clima_esc", "discusion", "educmadre", "educpadre", "libros"))
#Modelos de regresión logístico ordinales
library(MASS)
m1 <- polr(intpol_alc~intpol_papc, data=bbdd1, Hess = TRUE)
m2 <- polr(intpol_alc~intpol_papc + puntaje, data=bbdd1, Hess = TRUE)
m3 <- polr(intpol_alc~intpol_papc + puntaje + sexo, data=bbdd1, Hess = TRUE)
m4 <- polr(intpol_alc~intpol_papc + puntaje + sexo + clima_esc, data=bbdd1, Hess = TRUE)
m5 <- polr(intpol_alc~intpol_papc + puntaje + sexo + clima_esc + discusion, data=bbdd1, Hess = TRUE)
m6 <- polr(intpol_alc~intpol_papc + puntaje + sexo + clima_esc + discusion + libros, data=bbdd1, Hess = TRUE)
m7 <- polr(intpol_alc~intpol_papc + sexo + clima_esc + discusion + puntaje*libros, data=bbdd1, Hess = TRUE)
#Modelo de regresión losgístico ordinal
stargazer(m1,m2,m3,m4,m5,m6,m7, title = "Modelos logísticos ordinales interés político (estudiantes)",
column.labels=c("Modelo","Modelo","Modelo","Modelo","Modelo", "Modelo", "Modelo"),
covariate.labels=c("Interés politico (Padre):Poco", "Interés politico (Padre):Bastante", "Interés politico (Padre):Mucho", "Conocimiento cívico", "Hombre", "Clima Escolar", "Espacios de discusion", "Libros hogar: 10 a 25", "Libros hogar: 26 a 100", "Libros hogar: 101 a 200", "Libros hogar: 200 o más"),
type ='html', font.size = "small", align = TRUE, column.sep.width = "-15pt", ord.intercepts = T, style="all2")| Dependent variable: | |||||||
| intpol_alc | |||||||
| Modelo | Modelo | Modelo | Modelo | Modelo | Modelo | Modelo | |
| (1) | (2) | (3) | (4) | (5) | (6) | (7) | |
| Interés politico (Padre):Poco | 0.743*** | 0.528*** | 0.532*** | 0.552*** | 0.595*** | 0.528*** | 0.522*** |
| (0.074) | (0.076) | (0.076) | (0.081) | (0.083) | (0.084) | (0.084) | |
| Interés politico (Padre):Bastante | 0.395*** | 0.309*** | 0.310*** | 0.324*** | 0.357*** | 0.335*** | 0.333*** |
| (0.056) | (0.056) | (0.056) | (0.060) | (0.061) | (0.062) | (0.062) | |
| Interés politico (Padre):Mucho | 1.270*** | 0.988*** | 0.992*** | 1.004*** | 1.021*** | 0.916*** | 0.902*** |
| (0.120) | (0.120) | (0.120) | (0.128) | (0.131) | (0.134) | (0.134) | |
| Conocimiento cívico | 0.004*** | 0.004*** | 0.004*** | 0.004*** | 0.003*** | 0.004*** | |
| (0.0003) | (0.0003) | (0.0003) | (0.0003) | (0.0003) | (0.0004) | ||
| Hombre | -0.071 | -0.090* | -0.042 | -0.046 | -0.046 | ||
| (0.049) | (0.052) | (0.053) | (0.054) | (0.054) | |||
| Clima Escolar | 0.050*** | 0.019*** | 0.019*** | 0.019*** | |||
| (0.006) | (0.007) | (0.007) | (0.007) | ||||
| Espacios de discusion | 0.079*** | 0.081*** | 0.080*** | ||||
| (0.009) | (0.009) | (0.009) | |||||
| Libros hogar: 10 a 25 | 0.208*** | 0.738*** | |||||
| (0.067) | (0.283) | ||||||
| Libros hogar: 26 a 100 | 0.331*** | 0.389 | |||||
| (0.073) | (0.308) | ||||||
| Libros hogar: 101 a 200 | 0.527*** | 0.377** | |||||
| (0.109) | (0.179) | ||||||
| Libros hogar: 200 o más | 0.545*** | -1.562*** | |||||
| (0.138) | (0.077) | ||||||
| puntaje:libros10 a 25 | -0.001* | ||||||
| (0.001) | |||||||
| puntaje:libros26 a 100 | -0.0001 | ||||||
| (0.001) | |||||||
| puntaje:libros101 a 200 | 0.0003 | ||||||
| (0.0004) | |||||||
| puntaje:libros200 o más | 0.004*** | ||||||
| (0.0003) | |||||||
| Nada| Poco | -1.039*** | 0.908*** | 0.847*** | 1.633*** | 2.099*** | 2.068*** | 2.124*** |
| (0.046) | (0.123) | (0.130) | (0.169) | (0.181) | (0.184) | (0.206) | |
| Poco| Bastante | 1.236*** | 3.267*** | 3.207*** | 4.060*** | 4.548*** | 4.529*** | 4.587*** |
| (0.047) | (0.130) | (0.137) | (0.177) | (0.191) | (0.193) | (0.214) | |
| Bastante| Mucho | 3.241*** | 5.321*** | 5.260*** | 6.151*** | 6.656*** | 6.652*** | 6.718*** |
| (0.069) | (0.144) | (0.150) | (0.190) | (0.204) | (0.206) | (0.226) | |
| Observations | 6,119 | 6,119 | 6,119 | 5,475 | 5,244 | 5,208 | 5,208 |
| Residual Deviance | 14,203.210 (df = 6113) | 13,905.380 (df = 6112) | 13,903.290 (df = 6111) | 12,282.030 (df = 5466) | 11,694.370 (df = 5234) | 11,574.700 (df = 5194) | 11,558.320 (df = 5190) |
| Note: | p<0.1; p<0.05; p<0.01 | ||||||
#Gráfico de interacciones
plot_model(m7, type = "int", title = "Interacción conocimiento cívico y libros en el hogar", axis.title = c("Puntaje", "Interés Político (alumnos)"), legend.title = "Libros en el hogar")